Normalisation et validation d'images de documents capturées en mobilité

نویسندگان

  • Marçal Rusiñol
  • Joseph Chazalon
  • Jean-Marc Ogier
چکیده

Mobile document image acquisition integrates many distortions which must be corrected or detected on the device, before the document becomes unavailable or paying data transmission fees. In this paper, we propose a system to correct perspective and illumination issues, and estimate the sharpness of the image for OCR recognition. The correction step relies on fast and accurate border detection followed by illumination normalization. Its evaluation on a private dataset shows a clear improvement on OCR accuracy. The quality assessment step relies on a combination of focus measures. Its evaluation on a public dataset shows that this simple method compares well to state of the art, learning-based methods which cannot be embedded on a mobile, and outperforms metric-based methods. MOTS-CLÉS : acquisition d’image de document avec mobile ; correction de perspective ; correction d’illumination ; estimation de qualité ; mesure de focus ; prédiction de la fiabilité OCR

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Segmentation de séquences d'images en vue du codage. (Segmentation of image sequences for coding)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Propositions pour la recherche contextuelle d'images dans des documents XML

RÉSUMÉ. Cet article s’inscrit dans le cadre de la recherche d’images dans des documents XML. Ce type de recherche peut utiliser des informations sémantiques en plus des informations visuelles de l’image. Nous nous proposons ici d’explorer des pistes pour la recherche de ces informations sémantiques au sein des documents XML, en supposant qu’une image peut être présentée par les autres éléments ...

متن کامل

Impact de l'information visuelle pour la Recherche d'Images par le contenu et le contexte

RÉSUMÉ. Les documents multimédia composés de texte et d’images sont de plus en plus présents grâce à Internet et à l’augmentation des capacités de stockage. Cet article présente un modèle de représentation de documents multimédia qui combine l’information textuelle et l’information visuelle. En utilisant une approche par sac de mot, un document composé de texte et d’image peut être décrit par d...

متن کامل

Architecture des bases d'Images Généralistes Organisées en Clusters

Résumer. Les développements actuels, en matière de technologie liée à l’information numérique, ont permis l’acquisition et le stockage d’une quantité importante d’information, ce qui a engendré la nécessité d'élaborer des systèmes permettant la gestion de ces données (plus particulièrement les bases de données images). La recherche d’images par le contenu tente de répondre à ces besoins en se b...

متن کامل

Définition d'une structure adaptative de réseau local sans fil à consommation optimisée

Résumé: La forte croissance des réseaux sans fil bas débit (LR-WPAN), nous amène à considérer les problèmes d’autonomie, donc de durée de vie des nœuds d’un réseau, sachant que le changement des alimentations est souvent difficile à effectuer, d’une part. La mobilité inhérente à ce type de matériel est un élément essentiel, il en résultera des contraintes de routage, donc un problème complexe à...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014